Agenda
Visualización de datos
Código paso a paso
Estéticas
Datos ‘tidy’
El Operador Pipe
Principios del manejo de datos con {dplyr}
“The simple graph has brought more information to the data analyst’s mind than any other device.” — John Tukey
La visualización de datos es la creación y el estudio de la representación visual de los datos.
Muchas herramientas para visualizar datos, R es una de ellas.
Muchos enfoques/sistemas dentro de R para hacer visualizaciones de datos
Una gramática de gráficos es una herramienta que nos permite describir de manera concisa los componentes de un gráfico.
Es un lenguaje que permite dibujar un gráfico con palabras sencillas.
Uno puede describir el proceso de dibujar el gráfico con sus propias palabras y estas convertirse en gráfico.
{ggplot2} es el paquete de visualización de datos de tidyverse.
gg en {ggplot2} significa Gramática de gráficos.
Inspirado en el libro Grammar of Graphics de Leland Wilkinson
ggplot(data = [dataset],
mapping = aes(x = [x_variable],
y = [y_variable])) +
geom_xxx() +
other optionsAgenda
Visualización de datos
Código paso a paso
Estéticas
Datos ‘tidy’
El Operador Pipe
Principios del manejo de datos con {dplyr}
Inicia con el data.frame gapminder
Inicia con el data.frame
gapminder, mapea year a x
Inicia con el data.frame
gapminder, mapea year a x y mapea life_expectancy a y
Inicia con el data.frame
gapminder, mapea year a x y mapea life_expectancy a y. Representa cada información con un punto
Inicia con el data.frame
gapminder, mapea year a x y mapea life_expectancy a y. Representa cada información con un punto. Mapea continent al color de los puntos
Inicia con el data.frame
gapminder, mapea year a x y mapea life_expectancy a y. Representa cada información con un punto. Mapea continent al color de los puntos. Titula el gráfico como “Esperanza de vida a lo largo del tiempo”
Inicia con el data.frame
gapminder, mapea year a x y mapea life_expectancy a y. Representa cada información con un punto. Mapea continent al color de los puntos. Titula el gráfico como “Esperanza de vida a lo largo del tiempo” y agrega el subtitulo “Datos para Africa, Americas, Asia, Europa y Oceania”
Inicia con el data.frame
gapminder, mapea year a x y mapea life_expectancy a y. Representa cada información con un punto. Mapea continent al color de los puntos. Titula el gráfico como “Esperanza de vida a lo largo del tiempo” y agrega el subtitulo “Datos para Africa, Americas, Asia, Europa y Oceania”. Etiqueta los ejes x e y como “Año” y “Esperanza de Vida”, respectivamente
Inicia con el data.frame
gapminder, mapea year a x y mapea life_expectancy a y. Representa cada información con un punto. Mapea continent al color de los puntos. Titula el gráfico como “Esperanza de vida a lo largo del tiempo” y agrega el subtitulo “Datos para Africa, Americas, Asia, Europa y Oceania”. Etiqueta los ejes x e y como “Año” y “Esperanza de Vida”, respectivamente. Etiqueta la leyenda como “Continentes”
Inicia con el data.frame
gapminder, mapea year a x y mapea life_expectancy a y. Representa cada información con un punto. Mapea continent al color de los puntos. Titula el gráfico como “Esperanza de vida a lo largo del tiempo” y agrega el subtitulo “Datos para Africa, Americas, Asia, Europa y Oceania”. Etiqueta los ejes x e y como “Año” y “Esperanza de Vida”, respectivamente. Etiqueta la leyenda como “Continentes” y agrega un titulo para la fuente de datos
ggplot(data = gapminder,
mapping = aes(x = year,
y = life_expectancy,
colour = continent)) +
geom_point() +
labs(title = "Esperanza de vida a lo largo del tiempo",
subtitle = "Datos para Africa, Americas, Asia, Europa y Oceania",
x = "Año", y = "Esperanza de Vida",
colour = "Continentes",
caption = "Fuente: Gapminder data")Inicia con el data.frame
gapminder, mapea year a x y mapea life_expectancy a y. Representa cada información con un punto. Mapea continent al color de los puntos. Titula el gráfico como “Esperanza de vida a lo largo del tiempo” y agrega el subtitulo “Datos para Africa, Americas, Asia, Europa y Oceania”. Etiqueta los ejes x e y como “Año” y “Esperanza de Vida”, respectivamente. Etiqueta la leyenda como “Continentes” y agrega un titulo para la fuente de datos. Finalmente, usa una escala de colores discreta que esté diseñada para preservar la visualización de personas con formas comunes discapacidad visual para los colores
ggplot(data = gapminder,
mapping = aes(x = year,
y = life_expectancy,
colour = continent)) +
geom_point() +
labs(title = "Esperanza de vida a lo largo del tiempo",
subtitle = "Datos para Africa, Americas, Asia, Europa y Oceania",
x = "Año", y = "Esperanza de Vida",
colour = "Continentes",
caption = "Fuente: Gapminder data") +
scale_colour_viridis_d()ggplot(data = gapminder,
mapping = aes(x = year,
y = life_expectancy,
colour = continent)) +
geom_point() +
labs(title = "Esperanza de vida a lo largo del tiempo",
subtitle = "Datos para Africa, Americas, Asia, Europa y Oceania",
x = "Año", y = "Esperanza de Vida",
colour = "Continentes",
caption = "Fuente: Gapminder data") +
scale_colour_viridis_d()Inicia con el data.frame gapminder, mapea year a x y mapea life_expectancy a y.
Representa cada información con un punto.
Mapea continent al color de los puntos.
Titula el gráfico como “Esperanza de vida a lo largo del tiempo” y agrega el subtitulo “Datos para Africa, Americas, Asia, Europa y Oceania”.
Etiqueta los ejes x e y como “Año” y “Esperanza de Vida”, respectivamente.
Etiqueta la leyenda como “Continentes” y agrega un titulo para la fuente de datos.
Finalmente, usa una escala de colores discreta que esté diseñada para preservar la visualización de personas con formas comunes discapacidad visual para los colores.
Se puede omitir los nombres de los dos primeros argumentos cuando construimos gráficos con {ggplot2}.
Se puede realizar transformaciones sobre la marcha de las variables en los gráficos de {ggplot2}.
ggplot(data = gapminder2000,
mapping = aes(x = gdp,
y = life_expectancy,
colour = continent)) +
geom_point() +
labs(title = "PBI y esperanza de vida",
subtitle = "Datos para Africa, Americas, Asia, Europa y Oceania",
x = "Producto Bruto Interno",
y = "Esperanza de Vida",
colour = "Continentes",
caption = "Fuente: Gapminder data") +
scale_colour_viridis_d()ggplot(data = gapminder2000,
mapping = aes(x = log(gdp), #< Ponemos log()
y = life_expectancy,
colour = continent)) +
geom_point() +
labs(title = "PBI y esperanza de vida",
subtitle = "Datos para Africa, Americas, Asia, Europa y Oceania",
x = "Logaritmo de Producto Bruto Interno", #< Editamos nombre
y = "Esperanza de Vida",
colour = "Continentes",
caption = "Fuente: Gapminder data") +
scale_colour_viridis_d()
Descargue la carpeta comaprtida denominada taller02.
Abra el proyecto taller02.Rproj.
Abra el archivo quarto taller02.qmd.
Renderice el archivo quarto taller02.qmd. Abra el archivo taller02.html generado.
Desarrolle la PRIMERA PARTE del taller. Al final, renderice el archivo.
10:00
Agenda
Visualización de datos
Código paso a paso
Estéticas
Datos ‘tidy’
El Operador Pipe
Principios del manejo de datos con {dplyr}
Las características comunmente usadas en los gráficos que pueden ser mapeadas a variables específicas en los datos:
color
forma
tamaño
alfa (transparencia)
Mapeo: Determina el tamaño, alfa, etc. de los puntos basados en el valor de un variable en los datos:
Conocido en inglés como mapping.
Se configura como: aes()
Configuración: Determina el tamaño, alfa, etc. de los puntos SIN basarse en el valor de un variable en los datos:
Conocido en inglés como setting.
Se configura como: geom_* (en este caso fue geom_point, pero hay otras geometrías más)
{ggplot2} ofrece una serie de temas predinidos.
Un tema predefinido es una configuración pre-definida de componentes no dependientes de los datos (títulos, etiquetas, fuentes, fondo, grilas, leyendas, etc.) que pueden ser usados para darle un aspecto consistente a los gráficos.
Más info sobre los temas completas pre-definidos se pueden encontra en el siguiente enlace: Ver aquí.
Uno también puede personalizar sus propios temas: Ver aquí.
theme_gray (por defecto)
theme_bw()
theme_linedraw()
theme_light()
theme_dark()
theme_minimal()
theme_classic()
theme_void()
theme_test()
Se puede dividir la imagen en varias subimágenes de acuerdo a alguna otra condición.
Muy útil cuando se tienen grandes de datos y es de interés mostrar sus relaciones con varias variables.
Hay dos tipos de facetado:
facet_grid
facet_wrap
ggplot(data = gapminder,
mapping = aes(x = year,
y = life_expectancy)) +
geom_point() +
facet_grid(continent ~ .) +
scale_colour_viridis_d() +
theme_bw()ggplot(data = gapminder2000,
mapping = aes(x = log(gdp),
y = life_expectancy)) +
geom_point() +
facet_grid(. ~ continent) +
scale_colour_viridis_d() +
theme_bw()Trabaje con el mismo archivo quarto taller02.qmd.
Desarrolle la SEGUNDA PARTE de este taller siguiendo las instrucciones.
Al finalizar, renderice el archivo quarto.
Observe el archivo taller02.html.
10:00
Tomemos un descanso de 5 minutos…
Estire las piernas …
Deje de ver las pantallas …
… cualquier , las del celular también.
05:00
Agenda
Visualización de datos
Código paso a paso
Estéticas
Datos ‘tidy’
El Operador Pipe
Principios del manejo de datos con {dplyr}
Características de los datos ordenados o ‘tidy’
variable forma un columna.observación forma una fila.tipo de unidad observacional forma una tabla.Características de los datos desordenados o ‘untidy’
!@#$%^&*()
Al igual que {ggplot}, el paquete {dplyr}, también de {tidyverse}, ofrece toda una gramática llena de funciones que actúan como verbos para manipular data.frames.
select: extrae columnas usando nombresarrange: reordena filasslice: extrae filas usando índicesfilter: extrae filas que coincidan con criterios lógicosdistinct: filtra por filas únicasmutate: agrega nuevas variablessummarise: reduce variables a valoresgroup_by: para operacionesa agrupadas
El primer argumento siempre es el data frame.
Los argumentos subsecuentes dicen qué hacer con el data frame.
Siempre retorna un data frame.
No altera el data frame original.
Ver solamente country (países):
Inicia con la función (un verbo): select()
Primer argumento: data frame con el que trabajaremos, gapminder
Segundo argumento: variable que queremos seleccionar, country
Resultado: data frame con 10545 filas y 1 columna
Las funciones de dplyr siempre esperan un data frame y siempre generan un data frame.
Agenda
Visualización de datos
Código paso a paso
Estéticas
Datos ‘tidy’
El Operador Pipe
Principios del manejo de datos con {dplyr}
En programación, un
pipees una técnica para transmitir información de un proceso a otro.
En R, hay dos operadores pipe:
pipe de tidyverse: %>%
pipe nativo (de R base):|>
En este curso, usaremos el pipe de tidyverse: %>%
El operador pipe de tidyverse es del paquete {magrittr}, que no necesita ser cargado si es que se carga {tidyverse}.
Este operador conecta secuencia de acciones en forma de código:
yo
despierto a las 8 horas
salgo de cama por el lado derecho
visto pantalones y polo
salgo de casa con carro sin bicicleta
Atajo de teclado del operador pipe:
Ctrl + Shift + M
Ctrl + ⇧ + M
Sin %>%:
datos_fase1.# A tibble: 6 × 14
id time treat age race married marri…¹ proce…² weight height e2
<dbl> <fct> <fct> <dbl> <chr> <fct> <fct> <chr> <dbl> <dbl> <dbl>
1 1 Baseline Placebo 33 Mest… Single Withou… Callao 59 1.4 87.3
2 1 3 months Placebo 32 Mest… Single Withou… Callao 59.9 1.3 210.
3 2 Baseline Dosis 2 27 Mest… Single Withou… Santa … 62 1.5 169.
4 2 3 months Dosis 2 27 Mest… Single Withou… Santa … 62.1 1.6 99.9
5 3 Baseline Dosis 1 25 Mest… Single Withou… Callao 62 1.6 78.8
6 3 3 months Dosis 1 25 Mest… Single Withou… Callao 60 1.6 155.
# … with 3 more variables: lh <dbl>, fsh <dbl>, prog <dbl>, and abbreviated
# variable names ¹married2, ²procedence
Con %>%:
datos_fase1 solo se repite una vez.# A tibble: 6 × 14
id time treat age race married marri…¹ proce…² weight height e2
<dbl> <fct> <fct> <dbl> <chr> <fct> <fct> <chr> <dbl> <dbl> <dbl>
1 1 Baseline Placebo 33 Mest… Single Withou… Callao 59 1.4 87.3
2 1 3 months Placebo 32 Mest… Single Withou… Callao 59.9 1.3 210.
3 2 Baseline Dosis 2 27 Mest… Single Withou… Santa … 62 1.5 169.
4 2 3 months Dosis 2 27 Mest… Single Withou… Santa … 62.1 1.6 99.9
5 3 Baseline Dosis 1 25 Mest… Single Withou… Callao 62 1.6 78.8
6 3 3 months Dosis 1 25 Mest… Single Withou… Callao 60 1.6 155.
# … with 3 more variables: lh <dbl>, fsh <dbl>, prog <dbl>, and abbreviated
# variable names ¹married2, ²procedence
Agenda
Visualización de datos
Código paso a paso
Estéticas
Datos ‘tidy’
El Operador Pipe
Principios del manejo de datos con {dplyr}
El paquete {dplyr} es una ‘suite’ de funciones para manipular data frame.
| Verbos | Función |
|---|---|
| Extrae filas con filter() | |
| Extrae columnas con select() | |
| Reordena filas con arrange() | |
| Crea nuevas / remplaza columnas con mutate | |
| Haz resumenes agrupados con group_by() y summarize() | |
La función select() selecciona o excluye columnas.
El signo - permite elegir qué columnas eliminar.
A veces es mejor llamarla usando: dplyr::select() debido a que otros paquetes también tienen una función con el mismo nombre.
id, time, age, race y procedence:# A tibble: 106 × 5
id time age race procedence
<dbl> <fct> <dbl> <chr> <chr>
1 1 Baseline 33 Mestiza Callao
2 1 3 months 32 Mestiza Callao
3 2 Baseline 27 Mestiza Santa Anita
4 2 3 months 27 Mestiza Santa Anita
5 3 Baseline 25 Mestiza Callao
6 3 3 months 25 Mestiza Callao
7 4 Baseline 37 Mestiza Callao
8 4 3 months 38 Mestiza Callao
9 5 Baseline 31 Mestiza La Molina
10 5 3 months 32 Mestiza La Molina
# … with 96 more rows
# A tibble: 106 × 13
id time treat age race married marri…¹ weight height e2 lh fsh
<dbl> <fct> <fct> <dbl> <chr> <fct> <fct> <dbl> <dbl> <dbl> <dbl> <dbl>
1 1 Base… Plac… 33 Mest… Single Withou… 59 1.4 87.3 3.28 1.95
2 1 3 mo… Plac… 32 Mest… Single Withou… 59.9 1.3 210. 26.8 8.83
3 2 Base… Dosi… 27 Mest… Single Withou… 62 1.5 169. 6.34 4.32
4 2 3 mo… Dosi… 27 Mest… Single Withou… 62.1 1.6 99.9 5.77 1.7
5 3 Base… Dosi… 25 Mest… Single Withou… 62 1.6 78.8 11.9 2.81
6 3 3 mo… Dosi… 25 Mest… Single Withou… 60 1.6 155. 10.1 4.51
7 4 Base… Dosi… 37 Mest… Divorc… Withou… 60.9 1.5 41.0 4.57 3.81
8 4 3 mo… Dosi… 38 Mest… Divorc… Withou… 61.4 1.5 109. 7.29 2.39
9 5 Base… Plac… 31 Mest… Single Withou… 64 1.5 43.0 7.81 2.01
10 5 3 mo… Plac… 32 Mest… Single Withou… 58.1 1.6 56.0 9.15 3.66
# … with 96 more rows, 1 more variable: prog <dbl>, and abbreviated variable
# name ¹married2
age, race, married, married2, y procedence.# A tibble: 106 × 5
age race married married2 procedence
<dbl> <chr> <fct> <fct> <chr>
1 33 Mestiza Single Without couple Callao
2 32 Mestiza Single Without couple Callao
3 27 Mestiza Single Without couple Santa Anita
4 27 Mestiza Single Without couple Santa Anita
5 25 Mestiza Single Without couple Callao
6 25 Mestiza Single Without couple Callao
7 37 Mestiza Divorced Without couple Callao
8 38 Mestiza Divorced Without couple Callao
9 31 Mestiza Single Without couple La Molina
10 32 Mestiza Single Without couple La Molina
# … with 96 more rows
# A tibble: 106 × 5
id time treat age procedence
<dbl> <fct> <fct> <dbl> <chr>
1 1 Baseline Placebo 33 Callao
2 1 3 months Placebo 32 Callao
3 2 Baseline Dosis 2 27 Santa Anita
4 2 3 months Dosis 2 27 Santa Anita
5 3 Baseline Dosis 1 25 Callao
6 3 3 months Dosis 1 25 Callao
7 4 Baseline Dosis 1 37 Callao
8 4 3 months Dosis 1 38 Callao
9 5 Baseline Placebo 31 La Molina
10 5 3 months Placebo 32 La Molina
# … with 96 more rows
# A tibble: 106 × 5
id time treat age procedence
<dbl> <fct> <fct> <dbl> <chr>
1 40 Baseline Placebo 20 VES
2 40 3 months Placebo 20 VES
3 20 Baseline Placebo 22 Surquillo
4 20 3 months Placebo 22 Surquillo
5 29 Baseline Dosis 1 23 SJL
6 29 3 months Dosis 1 23 SJL
7 39 Baseline Dosis 2 23 Callao
8 39 3 months Dosis 2 23 Callao
9 3 Baseline Dosis 1 25 Callao
10 3 3 months Dosis 1 25 Callao
# … with 96 more rows
# A tibble: 106 × 5
id time treat age procedence
<dbl> <fct> <fct> <dbl> <chr>
1 22 Baseline Dosis 1 41 Chorrillos
2 22 3 months Dosis 1 41 Chorrillos
3 33 Baseline Dosis 2 41 SJL
4 33 3 months Dosis 2 41 SJL
5 51 Baseline Dosis 1 41 Surco
6 51 3 months Dosis 1 41 Surco
7 17 Baseline Placebo 40 Surquillo
8 17 3 months Placebo 40 Surquillo
9 28 Baseline Dosis 2 40 SJL
10 28 3 months Dosis 2 40 SJL
# … with 96 more rows
De acuerdo a índice (posición de fila):
De acuerdo a condición:
# A tibble: 3 × 14
id time treat age race married marri…¹ proce…² weight height e2
<dbl> <fct> <fct> <dbl> <chr> <fct> <fct> <chr> <dbl> <dbl> <dbl>
1 1 Baseline Placebo 33 Mest… Single Withou… Callao 59 1.4 87.3
2 1 3 months Placebo 32 Mest… Single Withou… Callao 59.9 1.3 210.
3 2 Baseline Dosis 2 27 Mest… Single Withou… Santa … 62 1.5 169.
# … with 3 more variables: lh <dbl>, fsh <dbl>, prog <dbl>, and abbreviated
# variable names ¹married2, ²procedence
# A tibble: 3 × 14
id time treat age race married marri…¹ proce…² weight height e2
<dbl> <fct> <fct> <dbl> <chr> <fct> <fct> <chr> <dbl> <dbl> <dbl>
1 2 Baseline Dosis 2 27 Mest… Single Withou… Santa … 62 1.5 169.
2 3 3 months Dosis 1 25 Mest… Single Withou… Callao 60 1.6 155.
3 5 3 months Placebo 32 Mest… Single Withou… La Mol… 58.1 1.6 56.0
# … with 3 more variables: lh <dbl>, fsh <dbl>, prog <dbl>, and abbreviated
# variable names ¹married2, ²procedence
# A tibble: 104 × 14
id time treat age race married marri…¹ proce…² weight height e2
<dbl> <fct> <fct> <dbl> <chr> <fct> <fct> <chr> <dbl> <dbl> <dbl>
1 1 3 months Place… 32 Mest… Single Withou… Callao 59.9 1.3 210.
2 2 3 months Dosis… 27 Mest… Single Withou… Santa … 62.1 1.6 99.9
3 3 Baseline Dosis… 25 Mest… Single Withou… Callao 62 1.6 78.8
4 3 3 months Dosis… 25 Mest… Single Withou… Callao 60 1.6 155.
5 4 Baseline Dosis… 37 Mest… Divorc… Withou… Callao 60.9 1.5 41.0
6 4 3 months Dosis… 38 Mest… Divorc… Withou… Callao 61.4 1.5 109.
7 5 Baseline Place… 31 Mest… Single Withou… La Mol… 64 1.5 43.0
8 5 3 months Place… 32 Mest… Single Withou… La Mol… 58.1 1.6 56.0
9 6 Baseline Place… 38 Mest… Married With c… Los Ol… 54.5 1.5 36.2
10 6 3 months Place… 38 Mest… Married With c… Los Ol… 53.9 1.5 44.7
# … with 94 more rows, 3 more variables: lh <dbl>, fsh <dbl>, prog <dbl>, and
# abbreviated variable names ¹married2, ²procedence
La función filter() selecciona individuos que cumplen una condición lógica.
Se debe usar operadores booleanos para construir condiciones lógicas simples o complejas.
| Argumento | Descripción |
|---|---|
| .data | Data frame o extensión de data frame (por ejemplo, tibble). |
| ... | Uno o más condiciones o pruebas que filter() evaluará en cada fila y seleccionará solo las condiciones que resulten verdaderas: TRUE. |
| Operador | Definición | Operador | Definición |
|---|---|---|---|
| < | menor que | A | B | A o B |
| <= | menor o igual que | is.na(A) | evalúa si A es NA |
| > | mayor que | !is.na(A) | evalúa si A no es NA |
| >= | mayor o igual que | A %in% B | evalúa si A está en B |
| == | exactamente igual a | !(A %in% B) | evalúa si A no está en B |
| != | diferente de | !A | no A |
| A & B | A y B |
# A tibble: 53 × 5
id time treat age procedence
<dbl> <fct> <fct> <dbl> <chr>
1 1 Baseline Placebo 33 Callao
2 2 Baseline Dosis 2 27 Santa Anita
3 3 Baseline Dosis 1 25 Callao
4 4 Baseline Dosis 1 37 Callao
5 5 Baseline Placebo 31 La Molina
6 6 Baseline Placebo 38 Los Olivos
7 7 Baseline Dosis 1 26 SMP
8 8 Baseline Placebo 34 Carabayllo
9 9 Baseline Dosis 2 30 SMP
10 10 Baseline Placebo 38 Pueblo Libre
# … with 43 more rows
Y que sean placebo:# A tibble: 17 × 5
id time treat age procedence
<dbl> <fct> <fct> <dbl> <chr>
1 1 Baseline Placebo 33 Callao
2 5 Baseline Placebo 31 La Molina
3 6 Baseline Placebo 38 Los Olivos
4 8 Baseline Placebo 34 Carabayllo
5 10 Baseline Placebo 38 Pueblo Libre
6 14 Baseline Placebo 33 Surquillo
7 15 Baseline Placebo 37 Comas
8 17 Baseline Placebo 40 Surquillo
9 18 Baseline Placebo 36 Miraflores
10 20 Baseline Placebo 22 Surquillo
11 21 Baseline Placebo 29 SJL
12 25 Baseline Placebo 37 San Borja
13 26 Baseline Placebo 32 Chosica
14 40 Baseline Placebo 20 VES
15 43 Baseline Placebo 36 Villa el Salvador
16 45 Baseline Placebo 35 Los Olivos
17 48 Baseline Placebo 27 Callao
# A tibble: 17 × 5
id time treat age procedence
<dbl> <fct> <fct> <dbl> <chr>
1 1 Baseline Placebo 33 Callao
2 5 Baseline Placebo 31 La Molina
3 6 Baseline Placebo 38 Los Olivos
4 8 Baseline Placebo 34 Carabayllo
5 10 Baseline Placebo 38 Pueblo Libre
6 14 Baseline Placebo 33 Surquillo
7 15 Baseline Placebo 37 Comas
8 17 Baseline Placebo 40 Surquillo
9 18 Baseline Placebo 36 Miraflores
10 20 Baseline Placebo 22 Surquillo
11 21 Baseline Placebo 29 SJL
12 25 Baseline Placebo 37 San Borja
13 26 Baseline Placebo 32 Chosica
14 40 Baseline Placebo 20 VES
15 43 Baseline Placebo 36 Villa el Salvador
16 45 Baseline Placebo 35 Los Olivos
17 48 Baseline Placebo 27 Callao
O que sean placebo:# A tibble: 70 × 5
id time treat age procedence
<dbl> <fct> <fct> <dbl> <chr>
1 1 Baseline Placebo 33 Callao
2 1 3 months Placebo 32 Callao
3 2 Baseline Dosis 2 27 Santa Anita
4 3 Baseline Dosis 1 25 Callao
5 4 Baseline Dosis 1 37 Callao
6 5 Baseline Placebo 31 La Molina
7 5 3 months Placebo 32 La Molina
8 6 Baseline Placebo 38 Los Olivos
9 6 3 months Placebo 38 Los Olivos
10 7 Baseline Dosis 1 26 SMP
# … with 60 more rows
# A tibble: 36 × 5
id time treat age procedence
<dbl> <fct> <fct> <dbl> <chr>
1 4 Baseline Dosis 1 37 Callao
2 4 3 months Dosis 1 38 Callao
3 6 Baseline Placebo 38 Los Olivos
4 6 3 months Placebo 38 Los Olivos
5 8 Baseline Placebo 34 Carabayllo
6 8 3 months Placebo 34 Carabayllo
7 10 Baseline Placebo 38 Pueblo Libre
8 10 3 months Placebo 38 Pueblo Libre
9 11 Baseline Dosis 2 37 El Agustino
10 11 3 months Dosis 2 36 El Agustino
# … with 26 more rows
# A tibble: 22 × 14
id time treat age race married marri…¹ proce…² weight height e2
<dbl> <fct> <fct> <dbl> <chr> <fct> <fct> <chr> <dbl> <dbl> <dbl>
1 1 Baseline Place… 33 Mest… Single Withou… Callao 59 1.4 87.3
2 1 3 months Place… 32 Mest… Single Withou… Callao 59.9 1.3 210.
3 2 Baseline Dosis… 27 Mest… Single Withou… Santa … 62 1.5 169.
4 2 3 months Dosis… 27 Mest… Single Withou… Santa … 62.1 1.6 99.9
5 3 Baseline Dosis… 25 Mest… Single Withou… Callao 62 1.6 78.8
6 3 3 months Dosis… 25 Mest… Single Withou… Callao 60 1.6 155.
7 4 Baseline Dosis… 37 Mest… Divorc… Withou… Callao 60.9 1.5 41.0
8 4 3 months Dosis… 38 Mest… Divorc… Withou… Callao 61.4 1.5 109.
9 7 Baseline Dosis… 26 Mest… Married With c… SMP 59.1 1.6 91.3
10 7 3 months Dosis… 26 Mest… Married With c… SMP 58.6 1.6 91.3
# … with 12 more rows, 3 more variables: lh <dbl>, fsh <dbl>, prog <dbl>, and
# abbreviated variable names ¹married2, ²procedence
# A tibble: 22 × 14
id time treat age race married marri…¹ proce…² weight height e2
<dbl> <fct> <fct> <dbl> <chr> <fct> <fct> <chr> <dbl> <dbl> <dbl>
1 1 Baseline Place… 33 Mest… Single Withou… Callao 59 1.4 87.3
2 1 3 months Place… 32 Mest… Single Withou… Callao 59.9 1.3 210.
3 2 Baseline Dosis… 27 Mest… Single Withou… Santa … 62 1.5 169.
4 2 3 months Dosis… 27 Mest… Single Withou… Santa … 62.1 1.6 99.9
5 3 Baseline Dosis… 25 Mest… Single Withou… Callao 62 1.6 78.8
6 3 3 months Dosis… 25 Mest… Single Withou… Callao 60 1.6 155.
7 4 Baseline Dosis… 37 Mest… Divorc… Withou… Callao 60.9 1.5 41.0
8 4 3 months Dosis… 38 Mest… Divorc… Withou… Callao 61.4 1.5 109.
9 7 Baseline Dosis… 26 Mest… Married With c… SMP 59.1 1.6 91.3
10 7 3 months Dosis… 26 Mest… Married With c… SMP 58.6 1.6 91.3
# … with 12 more rows, 3 more variables: lh <dbl>, fsh <dbl>, prog <dbl>, and
# abbreviated variable names ¹married2, ²procedence
pipeline:datos_fase1 %>%
filter(age > 35) %>% # Primero filtro por age
select(id, time, treat, race, age) %>% # Luego me quedo solo con estas 5 columnas
arrange(age) # Por último, reordenamos por edad# A tibble: 40 × 5
id time treat race age
<dbl> <fct> <fct> <chr> <dbl>
1 11 3 months Dosis 2 Mestiza 36
2 18 Baseline Placebo Mestiza 36
3 18 3 months Placebo Mestiza 36
4 43 Baseline Placebo Mestiza 36
5 43 3 months Placebo Mestiza 36
6 46 Baseline Dosis 2 Mestiza 36
7 46 3 months Dosis 2 Mestiza 36
8 4 Baseline Dosis 1 Mestiza 37
9 11 Baseline Dosis 2 Mestiza 37
10 15 Baseline Placebo Mestiza 37
# … with 30 more rows
Tomemos un descanso de 5 minutos…
Estire las piernas …
Deje de ver las pantallas …
… cualquier , las del celular también.
05:00
Trabaje con el mismo archivo quarto taller02.qmd.
Desarrolle la TERCERA PARTE de este taller siguiendo las instrucciones.
Desarrolle la CUARTA PARTE de este taller siguiendo las instrucciones.
Desarrolle la QUINTA PARTE de este taller siguiendo las instrucciones.
Al finalizar, renderice el archivo quarto.
Observe el archivo taller02.html generado.
30:00
@psotob91
https://github.com/psotob91
percys1991@gmail.comR Aplicado a los Proyectos de Investigación - Sesión 2